max length | sentence |
---|---|
8 | Schuttevaer - Vacature: Veiligheidscertificering engineer, medische apparatuur. |
7 | Vrienden belangrijker' (Nederlands Dagblad) |
6 | Vertrekkend Europees directeur Girish Ramachandran. |
6 | Bankdirecteur Graaimaar ontving nieuwe klanten. |
6 | Drenthe, Twente, Achterhoek, Groningen, Friesland, overal. |
6 | Vrouwelijke bierdrinkers hebben gemiddeld sterkere botten. |
6 | Providers kunnen hiertoe worden verplicht. |
6 | Mensen zullen verkeerde conclusies trekken. |
6 | Negentien personen werden tijdelijk aangehouden. |
6 | Twaalf andere slachtoffers raakten gewond. |
6 | Daarvoor worden tientallen treinen ingezet. |
6 | Hierbij werden persoonlijke bezittingen gestolen. |
6 | Desnoods moeten scholen hiertoe worden gedwongen. |
6 | Ongeveer zeventig personen raakten gewond. |
6 | Voorzichtige conclusie: Bittorrent-downloaders hebben inmiddels alternatieve torrentsites gevonden. |
6 | Allemaal zonder moeilijke gerechtelijke inmenging. |
6 | Balkenende: onderhandelingen worden 'pittig' |
6 | Italië, Zwitserland, Slowakije, Griekenland, Slovenië, Portugal, Frankrijk. |
6 | Alberto Contador blijft probleemloos leider. |
6 | Volkomen geliberaliseerde verzekeringsmaatschappijen hebben automatisch keurige omgangsvormen. |
6 | Hoeveel motorrijders rijden zonder oordopjes? |
6 | Daaruit kunnen betere filets worden gesneden. |
6 | Moeten inkomsten tv-sterren Omroep verder beperkt worden? |
6 | Enkele bedrijven zullen uiteraard vrijgesteld worden. |
6 | Kaapverdianen, Congolezen, Vietnamezen, Libanezen, zelden problemen. |
6 | Nieuwe, concrete maatregelen worden nauwelijks genoemd. |
6 | Re-integratiebudgetten worden actiever ingezet. |
5 | Verschillende bedrijven waren hiervoor verantwoordelijk. |
5 | Better Business Bureau hebben alarm geslagen. |
5 | Ideologisch verschillen beide groepen sterk. |
In this subsection, we order the sentences by the length of the shortest word an look for the sentences with the largest values. As explained in subsection 4.5.2.3, we expect to find non-typical sentences.
select min(char_length(word)) as a, s.sentence from sentences s, inv_w i, words w where s.s_id=i.s_id and i.w_id=w.w_id and length(sentence)>40 and i.w_id>100 group by s.s_id order by a desc limit 30;
4.5.2.1 Maximum word rank in sentence
4.5.2.2 Average word rank in sentence
4.5.2.3 Sentences consisting of many low frequency words I
4.5.2.4 Sentences consisting of many low frequency words II
4.5.2.5 Sentences consisting of short words only I
4.5.2.6 Sentences consisting of short words only II
4.5.2.8 Sentences consisting of long words only II